Source | # of sentences | Average logarithmic rank |
---|---|---|
http://koi.wikipedia.org/wiki/Перем_ладор | 20 | 5.74 |
http://koi.wikipedia.org/wiki/Вуктыл_район | 14 | 5.77 |
http://koi.wikipedia.org/wiki/Коми_отир | 19 | 5.81 |
http://koi.wikipedia.org/wiki/Коми_кыв | 35 | 5.93 |
http://koi.wikipedia.org/wiki/Коми_Республика | 22 | 5.98 |
http://koi.wikipedia.org/wiki/Луздор_район | 12 | 6.03 |
http://koi.wikipedia.org/wiki/Вишера_район | 13 | 6.07 |
http://koi.wikipedia.org/wiki/Чилимдін_район | 20 | 6.12 |
http://koi.wikipedia.org/wiki/Сӧснагорт_район | 16 | 6.14 |
http://koi.wikipedia.org/wiki/Зырянӧв_(Кӧчладор_район) | 18 | 6.16 |
http://koi.wikipedia.org/wiki/Мыс_(Кӧсладор_район) | 15 | 6.19 |
http://koi.wikipedia.org/wiki/Пономарёва_Лариса_Геннадьевна | 11 | 6.21 |
http://koi.wikipedia.org/wiki/Сэпӧль_(Кӧчладор_район) | 18 | 6.23 |
http://koi.wikipedia.org/wiki/Важ_перем_гижӧт | 12 | 6.24 |
http://koi.wikipedia.org/wiki/Зюзьдін_район | 19 | 6.28 |
http://koi.wikipedia.org/wiki/Перем_ладорись_Коми_кытш | 108 | 6.30 |
http://koi.wikipedia.org/wiki/Мылдін_район | 26 | 6.32 |
http://koi.wikipedia.org/wiki/Перем_Коми_кыв | 96 | 6.32 |
http://koi.wikipedia.org/wiki/Перем_комиэз | 177 | 6.33 |
http://koi.wikipedia.org/wiki/Чормӧс_(кар) | 12 | 6.33 |
http://koi.wikipedia.org/wiki/Ӧнтипинчи_(Юсьва_район) | 14 | 6.33 |
http://koi.wikipedia.org/wiki/Пару_(Кудымкар_район,_Иньвайыв_посадму) | 11 | 6.33 |
http://koi.wikipedia.org/wiki/Чудь-йӧгра_кыввез | 12 | 6.35 |
http://koi.wikipedia.org/wiki/Кӧрткерӧс_район | 16 | 6.36 |
http://koi.wikipedia.org/wiki/Суоми | 11 | 6.36 |
http://koi.wikipedia.org/wiki/Якутму | 14 | 6.37 |
http://koi.wikipedia.org/wiki/Ошыб_(Кудымкар_район) | 13 | 6.38 |
http://koi.wikipedia.org/wiki/Сыктывдін_район | 27 | 6.38 |
http://koi.wikipedia.org/wiki/Петыковчи_(Юсьва_район) | 12 | 6.39 |
http://koi.wikipedia.org/wiki/Чикманов_(Юсьва_район) | 23 | 6.40 |
Source | # of sentences | Average logarithmic rank |
---|---|---|
http://koi.wikipedia.org/wiki/Африка | 16 | 7.74 |
http://koi.wikipedia.org/wiki/Стражжез_галактикалӧн_(фильм) | 37 | 7.74 |
http://koi.wikipedia.org/wiki/Маньси_кыв | 41 | 7.71 |
http://koi.wikipedia.org/wiki/Улісь_иньва_диалект | 13 | 7.62 |
http://koi.wikipedia.org/wiki/Вин_Дизель | 26 | 7.57 |
http://koi.wikipedia.org/wiki/Волегов_Федот_Алексеевич | 12 | 7.51 |
http://koi.wikipedia.org/wiki/Унайыла_сёрникузя | 11 | 7.48 |
http://koi.wikipedia.org/wiki/Кыдз | 31 | 7.48 |
http://koi.wikipedia.org/wiki/Тӧдчанним | 24 | 7.37 |
http://koi.wikipedia.org/wiki/Лыдним | 23 | 7.34 |
http://koi.wikipedia.org/wiki/Чомор | 37 | 7.33 |
http://koi.wikipedia.org/wiki/Торокан | 18 | 7.33 |
http://koi.wikipedia.org/wiki/Одиссея | 60 | 7.26 |
http://koi.wikipedia.org/wiki/Лужиков_Александр_Михайлович | 12 | 7.23 |
http://koi.wikipedia.org/wiki/Кудым_Ош | 36 | 7.18 |
http://koi.wikipedia.org/wiki/Усикавпунки_(коммуна) | 14 | 7.16 |
http://koi.wikipedia.org/wiki/Выльгорт | 14 | 7.14 |
http://koi.wikipedia.org/wiki/Эманим | 14 | 7.13 |
http://koi.wikipedia.org/wiki/Киняргванда | 16 | 7.11 |
http://koi.wikipedia.org/wiki/Сибир_шӧрись_джуджытін | 12 | 7.11 |
http://koi.wikipedia.org/wiki/Ниппон | 15 | 7.10 |
http://koi.wikipedia.org/wiki/Оката_саридз | 31 | 7.09 |
http://koi.wikipedia.org/wiki/Миян_айным | 12 | 7.07 |
http://koi.wikipedia.org/wiki/Красинькӧв_(Кӧсладор_район) | 23 | 7.07 |
http://koi.wikipedia.org/wiki/Коми_отирлӧн_сёян-юан | 21 | 7.04 |
http://koi.wikipedia.org/wiki/Гаврив_Пёдор | 18 | 7.03 |
http://koi.wikipedia.org/wiki/Майкар_(Юсьва_район) | 32 | 7.03 |
http://koi.wikipedia.org/wiki/Изьватас | 12 | 7.00 |
http://koi.wikipedia.org/wiki/Шонді | 27 | 6.98 |
http://koi.wikipedia.org/wiki/Эжва_(ю) | 29 | 6.98 |
In this subsection we replace average word length by average logarithmic word rank. The logarithm of the word rank is taken because we want to punish words of high ranks only moderately.
First table:
select source, count(distinct i_s.s_id) as cnt_s, round(avg(log(w.w_id-100)),2) as av from sources so, inv_so i_s, inv_w i, words w where so.so_id=i_s.so_id and i_s.s_id=i.s_id and i.w_id=w.w_id and w.w_id>100 group by source having cnt_s>10 order by av LIMIT 30;
6.4.2.1 Average word length for different sources
6.4.2.3 Sources consisting of many / few words with frequency 1
6.4.2.4 Sources with low / high average word length of rare words